R 프로그래밍 입문: 확률과 데이터를 연결하는 방법

원시 관측값을 구조화된 R 객체 로 변환하는 것은 확률적 분석에 필요한 기술적 처리 흐름입니다. 분포 모델링 전에 우리는 데이터 수집 리스트, 행렬, 그리고 데이터 프레임 간의 구조적 특징을 익혀야 합니다.

1. 구조화된 데이터 수집

다음과 같이 데이터를 가져올 때 scan() 종종 가짜 리스트 구조 변수 유형을 정의하기 위해 필요합니다 (예: list(id="", x=0)). 이를 통해 외부 파일(예: input.dat )에서 온 데이터가 평탄한 벡터가 아닌 다루기 쉬운 구성 요소로 파싱됩니다.

2. 차원 조직

행렬은 동일한 숫자형 데이터 집합에 사용되며 ( matrix byrow=TRUE 를 활용하여), byrow=TRUE)는 통계 모델링을 위한 결정적 연결 고리로서, data.frame() 이질적인 데이터 형식이 함께 존재할 수 있도록 해줍니다.

3. 변수 접근성

추론을 위해 데이터에 접근하려면 다음 방식으로 인덱스를 사용합니다: inp[[1]] 또는 이름 붙은 열인 inp$id와 같은 함수를 사용하면 전체 객체 내의 변수(예: attach() )를 반복적인 인덱싱 없이 직접 접근할 수 있습니다. 전체 객체 (예: eruptions)

TERMINALbash — 80x24

> Ready. Click "Run" to execute.